# 删除明显异常值，存在负值的样本
import pandas as pd

# 读取CSV文件
df = pd.read_csv('updated_pollution_dataset.csv')

# 选择数值列
numeric_cols = df.select_dtypes(include=['number'])

# 识别负值
negative_values = numeric_cols.lt(0)

# 计算每行的负值数量
rows_with_negative_values = negative_values.any(axis=1)

# 删除包含负值的行
df = df.loc[~rows_with_negative_values]

# 显示删除负值后的DataFrame信息
print("删除负值样本后的DataFrame信息：")

# 显示DataFrame的概要信息
df.info()

# 显示DataFrame的描述性统计信息
print(df.describe())

df.to_csv('no_neg.csv', index=False)
